26 research outputs found

    MADGene: retrieval and processing of gene identifier lists for the analysis of heterogeneous microarray datasets

    Get PDF
    Summary: MADGene is a software environment comprising a web-based database and a java application. This platform aims at unifying gene identifiers (ids) and performing gene set analysis. MADGene allows the user to perform inter-conversion of clone and gene ids over a large range of nomenclatures relative to 17 species. We propose a set of 23 functions to facilitate the analysis of gene sets and we give two microarray applications to show how MADGene can be used to conduct meta-analyses

    Immune Response and Mitochondrial Metabolism Are Commonly Deregulated in DMD and Aging Skeletal Muscle

    Get PDF
    Duchenne Muscular Dystrophy (DMD) is a complex process involving multiple pathways downstream of the primary genetic insult leading to fatal muscle degeneration. Aging muscle is a multifactorial neuromuscular process characterized by impaired muscle regeneration leading to progressive atrophy. We hypothesized that these chronic atrophying situations may share specific myogenic adaptative responses at transcriptional level according to tissue remodeling. Muscle biopsies from four young DMD and four AGED subjects were referred to a group of seven muscle biopsies from young subjects without any neuromuscular disorder and explored through a dedicated expression microarray. We identified 528 differentially expressed genes (out of 2,745 analyzed), of which 328 could be validated by an exhaustive meta-analysis of public microarray datasets referring to DMD and Aging in skeletal muscle. Among the 328 validated co-expressed genes, 50% had the same expression profile in both groups and corresponded to immune/fibrosis responses and mitochondrial metabolism. Generalizing these observed meta-signatures with large compendia of public datasets reinforced our results as they could be also identified in other pathological processes and in diverse physiological conditions. Focusing on the common gene signatures in these two atrophying conditions, we observed enrichment in motifs for candidate transcription factors that may coordinate either the immune/fibrosis responses (ETS1, IRF1, NF1) or the mitochondrial metabolism (ESRRA). Deregulation in their expression could be responsible, at least in part, for the same transcriptome changes initiating the chronic muscle atrophy. This study suggests that distinct pathophysiological processes may share common gene responses and pathways related to specific transcription factors

    Meta-analysis of muscle transcriptome data using the MADMuscle database reveals biologically relevant gene patterns

    Get PDF
    <p>Abstract</p> <p>Background</p> <p>DNA microarray technology has had a great impact on muscle research and microarray gene expression data has been widely used to identify gene signatures characteristic of the studied conditions. With the rapid accumulation of muscle microarray data, it is of great interest to understand how to compare and combine data across multiple studies. Meta-analysis of transcriptome data is a valuable method to achieve it. It enables to highlight conserved gene signatures between multiple independent studies. However, using it is made difficult by the diversity of the available data: different microarray platforms, different gene nomenclature, different species studied, etc.</p> <p>Description</p> <p>We have developed a system tool dedicated to muscle transcriptome data. This system comprises a collection of microarray data as well as a query tool. This latter allows the user to extract similar clusters of co-expressed genes from the database, using an input gene list. Common and relevant gene signatures can thus be searched more easily. The dedicated database consists in a large compendium of public data (more than 500 data sets) related to muscle (skeletal and heart). These studies included seven different animal species from invertebrates (<it>Drosophila melanogaster, Caenorhabditis elegans</it>) and vertebrates (<it>Homo sapiens, Mus musculus, Rattus norvegicus, Canis familiaris, Gallus gallus</it>). After a renormalization step, clusters of co-expressed genes were identified in each dataset. The lists of co-expressed genes were annotated using a unified re-annotation procedure. These gene lists were compared to find significant overlaps between studies.</p> <p>Conclusions</p> <p>Applied to this large compendium of data sets, meta-analyses demonstrated that conserved patterns between species could be identified. Focusing on a specific pathology (Duchenne Muscular Dystrophy) we validated results across independent studies and revealed robust biomarkers and new pathways of interest. The meta-analyses performed with MADMuscle show the usefulness of this approach. Our method can be applied to all public transcriptome data.</p

    Une méthode implicative pour l'analyse de données d'expression de gènes

    No full text

    Application de techniques de fouille de données en Bio-informatique

    Get PDF
    Les travaux de recherche présentés par l'auteur ont pour objet l'application de techniques d'extraction de connaissances à partir de données (ECD) en biologie. Deux thèmes majeurs de recherche en bio-informatique sont abordés : la recherche d'homologues distants dans des familles de protéines et l'analyse du transcriptome. La recherche d'homologues distants à partir de séquences protéiques est une problématique qui consiste à découvrir de nouveaux membres d'une famille de protéines. Celle-ci partageant généralement une fonction biologique, l'identification de la famille permet d'investiguer le rôle d'une séquence protéique. Des classifieurs ont été développés pour discriminer une superfamille de protéines particulière, celle des cytokines. Ces protéines sont impliquées dans le système immunitaire et leur étude est d'une importance cruciale en thérapeutique. La technique des Séparateurs à Vastes Marges (SVM) a été retenue, cette technique ayant donné les résultats les plus prometteurs pour ce type d'application. Une méthode originale de classification a été conçue, basée sur une étape préliminaire de découverte de mots sur-représentés dans la famille d'intérêt. L'apport de cette démarche est d'utiliser un dictionnaire retreint de motifs discriminants, par rapport à des techniques utilisant un espace global de k-mots. Une comparaison avec ces dernières méthodes montre la pertinence de cette approche en termes de performances de classification. La seconde contribution pour cette thématique porte sur l'agrégation des classifieurs basée sur des essaims grammaticaux. Cette méthode vise à optimiser l'association de classifieurs selon des modèles de comportement sociaux, à la manière des algorithmes génétiques d'optimisation. Le deuxième axe de recherche traite de l'analyse des données du transcriptome. L'étude du transcriptome représente un enjeu considérable, tant du point de vue de la compréhension des mécanismes du vivant que des applications cliniques et pharmacologiques. L'analyse implicative sur des règles d'association, développée initialement par Régis Gras, a été appliquée aux données du transcriptome. Une approche originale basée sur des rangs d'observation a été proposée. Deux applications illustrent la pertinence de cette méthode : la sélection de gènes informatifs et la classification de tumeurs. Enfin, une collaboration étroite avec une équipe INSERM dirigée par Rémi Houlgatte a conduit à l'enrichissement d'une suite logicielle dédiée aux données de puces à ADN. Cette collection d'outils dénommée MADTOOLS a pour objectifs l'intégration de données du transcriptome et l'aide à la méta-analyse. Une application majeure de cette suite utilise les données publiques relatives aux pathologies musculaires. La méta-analyse, en se basant sur des jeux de données indépendants, améliore grandement la robustesse des résultats. L'étude systématique de ces données a mis en évidence des groupes de gènes co-exprimés de façon récurrente. Ces groupes conservent leur propriété discriminante au travers de jeux très divers en termes d'espèces, de maladies ou de conditions expérimentales. Cette étude peut évidemment se généraliser à l'ensemble des données publiques concernant le transcriptome. Elle ouvre la voie à une approche à très grande échelle de ce type de données pour l'étude d'autres pathologies humaines

    CPD tree learning using contexts as background knowledge

    No full text
    International audienc

    Agrégation de classi eurs et d'experts pour la recherche d'homologues chez les cytokines à quatre hélices alpha

    No full text
    L'objectif de ce travail est la mise au point d'une méthode de détection d'homologues de cytokines inconnues. J'ai dans un premier temps évalué plusieurs classifieurs SVM. J'ai ensuite proposé d'ajouter, sous la forme d'experts automatiques, des connaissances spécifiques à la famille étudiée. Enfin, afin de maximiser l'efficacité de leur association, j'ai comparé différentes méthodes d'agrégation. Je propose une méthode performante, basée sur la combinaisons de ces classifieurs et de ces experts, généralisable à d'autres familles de protéines.I was working on a particular gene family : the four helix cytokines. The major purpose of this work was to design a new method to detected still unknown members in the human genome. The first part of my work was to compare SVM classifiers, which is known as the best strategy for homologs research, from the literature. During the second part of my work, i designed automatical experts which deals with information like biological features.The last part of my work consisted in evaluating methods to aggregate classifiers and experts. This strategy achieve better results than the best classifer alone and it can easily be adapted to other gene family.NANTES-BU Médecine pharmacie (441092101) / SudocSudocFranceF

    Détection de faibles homologies de proteines par machines à vecteurs de support

    No full text
    National audienceno abstrac

    Multiple hypothesis testing and quasi essential graph for comparing two sets of bayesian networks

    No full text
    International audienc

    Le Méthane et le destin de la Terre : Les Hydrates de méthane : rêve ou cauchemar?

    No full text
    Les hydrates de méthane représentent une phase solide constituée de glace et de méthane: elles constituent sur terre plusieurs dizaines de milliers de milliards de tonnes de gaz, ce qui représente un trésor énergétique inouï, ... et dévoile un danger potentiel pour l'humanité, aussi bien sur le plan climatologique que géologique... Cet ouvrage scientifique, écrit par quatre experts, fait le point sur ce phénomène qui intéresse les plus hautes autorités mondiales. L'ouvrage présente ainsi: -définition et propriétés des clathrates -les HM en milieu océanique -les HM du Permafrost -Rappels sur l'effet de serre -Le cycle du méthane -les cycles glaciaires-interglaciaires -le rôle du Méthane dans l'histoire de la Terre -Les HD, source potentielle d'énergie
    corecore